異世界的知識推薦：引言與資料準備

2023 iThome 鐵人賽

DAY 14

AI & Data

關於我轉生變成AI詠唱師這檔事系列第 14 篇

15th鐵人賽

Sam

團隊Quokka In The Cloud

2023-09-29 06:55:47

392 瀏覽

分享至

在這個充滿奇幻與科技的異世界，我們將探索一種全新的知識推薦魔法。這種魔法利用了一種名為 embeddings 的神秘力量，能夠找到相似的新聞文章，帶領我們走向更深層的知識領域。

首先，我們需要準備資料，並且導入必要的套件。我們選擇了 AG 的新聞文章作為我們的數據集，並且將進行一些基本的數據探索，例如查看數據集的前幾行。

import pandas as pd
import pickle
from openai.embeddings_utils import (
    get_embedding,
    distances_from_embeddings,
    tsne_components_from_embeddings,
    chart_from_components,
    indices_of_nearest_neighbors_from_distances,
)

# 加載數據
dataset_path = "data/AG_news_samples.csv"
df = pd.read_csv(dataset_path)
n_examples = 5
df.head(n_examples)

透過這段程式碼，我們能夠觀察到數據集的結構和內容，為接下來的知識推薦魔法奠定基礎。在這個過程中，我們會學習到 embeddings 的基礎知識，並且探索如何利用它們來發掘相似的文章。